[livres divers classés par sujet] [Informatique] [Algorithmique] [Programmation] [Mathématiques] [Hardware] [Robotique] [Langage] [Intelligence artificielle] [Réseaux]
[Bases de données] [Télécommunications] [Chimie] [Médecine] [Astronomie] [Astrophysique] [Films scientifiques] [Histoire] [Géographie] [Littérature]

3 - Utilisation d'un modèle d'audition et de connaissances phonétiques en reconnaissance automatique de la parole

contributor CRIN/INRIA, Vandœuvre lès Nancy 54506
creator JUNQUA (J.-C.)
date 2005-07-22T08:26:53Z
2005-07-22T08:26:53Z
1990
description Including speech knowledge in automatic speech recognition (ASR) systems is a good way to improve the performance of recognizers . In this paper, we propose the ORION system which deals with speaker-independent ASR for isolated-words . ORION is a two-pass hybrid system which uses several types of knowledge . This knowledge applies to psychoacoustics, physiology and phonetics . During the first pass an auditory model, PLP (perceptually-based linear prediction analysis) combines static and dynamic features to provide a set of parameters to the dynamic programming algorithm . After this stage 98 % recognition accuracy was obtained for a digit vocabulary and 12 templates per word . The introduction of phonetic knowledge in the second pass decreases the error rate by more Chan 60 % (compared to the results of the first pass) for a confusable vocabulary (E-SET) .
L'introduction de connaissances dans les systèmes de reconnaissance de parole (RAP) est un bon moyen d'améliorer les performances des systèmes actuels . Dans cet article nous proposons le système ORION dans le cadre d'une application de reconnaissance multilocuteur de mots isolés . ORION est un système hybride à deux passes intégrant plusieurs sources de connaissances : psychoacoustiques, physiologiques et phonétiques . Pendant la première passe un modèle d'analyse acoustique perceptivement fondé (PLP), combinant des caractéristiques instantanées et des caractéristiques spectrales dynamiques, est utilisé pour fournir des vecteurs de paramètres à un algorithme de programmation dynamique . A l'issue de cette première passe plus de 98 % de mots ont été correctement reconnus pour un vocabulaire de chiffres et 12 références par mot. L'introduction de connaissances phonétiques durant la deuxième passe diminue l'erreur de reconnaissance de plus de 60 % (par rapport aux résultats obtenus lors de la première passe) pour un vocabulaire de mots acoustiquement similaires (E-SET) .
format 52628 bytes
application/pdf
identifier Traitement du Signal [Trait. Signal], 1990, Vol. 7, N° 4-NS, p. 275-284
0765-0019
  http://hdl.handle.net/2042/1729
language en_US
publisher GRETSI, Saint Martin d'Hères, France
rights http://irevues.inist.fr/IMG/pdf/Licence.pdf
source Traitement du Signal [Trait. Signal], ISSN 0765-0019, 1990, Vol. 7, N° 4-NS, p. 275-284
subject Reconnaissance parole
Mesure
Reconnaissance automatique
Locuteur
Mot isolé
Discrimination
Phonétique
Système hybride
Caractéristique spectrale
Psychoacoustique
title 3 - Utilisation d'un modèle d'audition et de connaissances phonétiques en reconnaissance automatique de la parole
On the use of an auditory model and phonetic knowledge for automatic speech recognition
type Article